当前位置: 开发笔记 > 编程语言 > 正文

尺寸|估计值_MOT综述(2021)

作者：sunsijia | 来源：互联网 | 2023-06-29 21:56

篇首语：本文由编程笔记#小编为大家整理，主要介绍了MOT综述(2021)相关的知识，希望对你有一定的参考价值。@TOC1.简介

篇首语：本文由编程笔记#小编为大家整理，主要介绍了MOT综述 (2021)相关的知识，希望对你有一定的参考价值。

&＃64;TOC

1. 简介

参考论文《Analysis Based on Recent Deep Learning Approaches Applied in Real-Time Multi-Object Tracking: A Review》
JDE&＃xff1a;Joint Detection and Embedding &＃xff08;一阶段&＃xff1a;一个端到端的网络同时输出检测结果和对应检测Box的外观特征向量&＃xff09;
SDE&＃xff1a;Separate Detection and Embedding &＃xff08;两阶段&＃xff1a;先检测Box&＃xff0c; 然后再计算检测Box对应的外观特征向量&＃xff09;
MOT方法分类&＃xff1a;
- 在线方法&＃xff08;Online Method&＃xff09;&＃xff1a;只使用当前和过去的信息
- 批处理方法&＃xff08;Batch Method&＃xff09;&＃xff1a;使用未来的信息

1.1 轨迹与检测Box的关联特征

运动特征&＃xff08;motion&＃xff09;
外观特征&＃xff08;appearance&＃xff09;
位置特征&＃xff08;location&＃xff09;

1.1 MOT挑战

人体姿势、摄像机视角、照明、遮挡、分辨率、背景杂乱和其他意外场景的复杂变化频繁发生
人员拥挤并快速移动 (crowded scenes and fast motion, 如长跑)

1.2 轻量级网络

SqueezeNet&＃xff1a;通过使用 1×1 卷积层“挤压”特征图通道来实现更高的运行速度
MobileNet&＃xff1a; 通过使用低成本的深度卷积层和逐点卷积层替换高资源消耗的卷积层来减少运行时间
ShuffleNet&＃xff1a;通过减少element-wise算子和平衡输入输出通道&＃xff0c;在推理过程中降低了MAC&＃xff08;Memory Access Cost&＃xff09;&＃xff0c;进一步提高了网络运行速度

2. 方法汇总及分类

3. FairMOT

FairMOT&＃xff1a;使用外观特征可以执行长距离的关联&＃xff0c;而且可以处理遮挡情况

3.1 One-shot跟踪器中的不公平性问题

3.1.1 Anchors导致的不公平

基于anchor的设计不适合学习re-ID特征&＃xff0c;尽管检测结果很好&＃xff0c;但会导致大量的ID切换,其原因如下&＃xff1a;
- re-ID任务得不到公平的学习&＃xff1a;导致re-ID特征质量不高
- 一个Anchor对应多个目标&＃xff1a;提取的特征在准确性和有区别地表示目标对象方面不是最优的
- 多个Anchors包含同一个目标&＃xff1a;一个具体的目标取哪一个Anchor很难准确判断

3.1.2 特征导致的不公平

大部分特征在对象检测和re-ID任务间共享&＃xff0c;但不同任务需要不同层次的特征
- 对象检测&＃xff1a;需要深层抽象特征估计对象的类别和位置
- re-ID任务&＃xff1a;需要浅层外观特征&＃xff0c;以区分相同类别的不同实例
从多任务损失函数优化的角度看&＃xff0c;对象检测与re-ID的优化目标是冲突的&＃xff0c;所以必须有对应的策略来平衡这个优化

3.1.3 特征维度导致的不公平

以前的re-ID&＃xff0c;为了在benchmarks上获得好的效果&＃xff0c;经常学习高维的特征向量
对于one-shot MOT&＃xff0c;学习低维特征更好的理由&＃xff1a;
- 高维 re-ID 特征显着损害目标检测精度&＃xff1a;由于两个任务的竞争&＃xff0c;从而对最终跟踪精度产生负面影响 &＃xff08;对象检测的特征维度很低&＃xff1a;类别号&＃43;box位置&＃xff09;&＃xff0c;所以需要学习低维re-ID特征以平衡这两个任务
- MOT任务不同于re-ID任务&＃xff1a;MOT任务在相邻两帧间执行1到1匹配&＃xff0c;而re-ID任务需要查询大量的候选项&＃xff0c;因此需要更高维的特征
- 学习低维特征可以提高推理速度

3.2 FairMOT网络组成

FairMOT主要由以下三部分组成&＃xff1a;
- 主干网络
- 对象检测分支
- re-ID分支

3.2.1 主干网络&＃xff08;Backbone Network&＃xff09;

为取得最佳的准确度和速度&＃xff0c;主干网络使用ResNet-34&＃xff0c;把深层聚合&＃xff08;DLA&＃xff1a;Deep Layer Aggregation&＃xff09;应用到主敢网络以融合多层特征。不同于原始的DLA&＃xff0c;在低级与高级特征间有更多skip链接&＃xff0c;类似于特征金字塔&＃xff08;FPN&＃xff1a;Feature Pyramid Network&＃xff09;

3.2.2 检测分支&＃xff08;Detection Branch&＃xff09;

检测分支构建于CenterNet之上&＃xff0c;三个并行的heads附加在DLA-34上&＃xff0c;用于分别估计&＃xff1a;
- heatmaps
- object center offsets
- bounding box sizes
每个head把具有256个channels的3x3卷积应用于DLA-34输出的特征图上&＃xff0c;然后由一个1x1的卷积层输出最后的结果

3.2.2.1 热图头&＃xff08;Heatmap Head &＃xff09;

此热图头负责估计对象中心的位置
如果热图中某个位置的响应与真实对象中心重合&＃xff0c;则该位置的响应预计为 1
响应随着热图位置和对象中心之间的距离呈指数衰减
对于图像中的真实Box的位置&＃xff1a;
$b^i &＃61; (x_1^i, y_1^i, x_2^i, y_2^i)$
则对象的中心为&＃xff1a;
$(c_x^i, c_y^i) &＃61; (\\fracx_1^i &＃43; x_2^i2, \\fracy_1^i &＃43; y_2^i2 )$
对象中心在特征图中的坐标为&＃xff1a;
$(\\widetilde c_x^i, \\widetilde c_y^i) &＃61; (\\lfloor \\fracc_x^i4 \\rfloor, \\lfloor \\fracc_y^i4 \\rfloor)$

xi,c

yi)&＃61;(⌊4cxi⌋,⌊4cyi⌋)
热图在位置 $(x, y)$ 处的响应为&＃xff1a;
$M_xy &＃61; \\sum_i&＃61;1^N exp^-\\frac(x - \\widetilde c_x^i)^2 &＃43; (y - \\widetilde c_y^i)^22 \\sigma_c^2$

xi)2&＃43;(y−c

yi)2
- N&＃xff1a;表示图像中对象的个数
- $\\sigma_c$ &＃xff1a;表示标准偏差
热图的损失函数&＃xff1a;定义为具有焦点损失&＃xff08;focal loss&＃xff09;的像素级逻辑回归
$L_heat &＃61; - \\frac1N \\sum_xy \\begincases (1 - \\hat M_xy)^\\alpha log (\\hat M_xy), & \\textif $M_xy&＃61;1$ \\\\ (1 - M_xy)^\\beta(\\hat M_xy)^\\alpha log (1- \\hat M_xy), & \\textotherwise \\endcases \\quad (1)$
- $\\hat M$ &＃xff1a;是估计的热图
- $M$ &＃xff1a;是真实的热图
- $\\alpha, \\beta$ &＃xff1a;是focal loss中预定义的参数

3.2.2.2 检测框偏移量头&＃xff08;Box Offset Head&＃xff09;

检测框偏移量头&＃xff1a;使目标的定位更加准确
由于最终特征图的步幅为四&＃xff0c;因此将引入多达四个像素的量化误差。该分支估计每个像素相对于对象中心的连续偏移&＃xff0c;以减轻下采样的影响。
检测框偏移量头输出的估计值:
$var cpro_id = "u6885494";$

编程

object

view

join

io

深度

ip

branch

heatmap

写下你的评论吧 !

吐个槽吧,看都看了

会员登录 | 用户注册

推荐阅读

default
设计无SQL死锁的编码模式 - Achieving SQL Deadlock-Free Design

在运行于MS SQL Server 2005的.NET 2.0 Web应用中，我偶尔会遇到令人头疼的SQL死锁问题。过去，我们主要通过调整查询来解决这些问题，但这既耗时又不可靠。我希望能找到一种确定性的查询模式，确保从设计上彻底避免SQL死锁。 ... [详细]

蜡笔小新   2024-11-16 13:09:51

php
Oracle SQL 第二天

本文介绍了 Oracle SQL 中的集合运算、子查询、数据处理、表的创建与管理等内容。包括查询部门号为10和20的员工信息、使用集合运算、子查询的注意事项、数据插入与删除、表的创建与修改等。 ... [详细]

蜡笔小新   2024-11-16 16:43:29

java
兆芯X86 CPU架构的演进与现状（国产CPU系列）

本文详细介绍了兆芯X86 CPU架构的发展历程，从公司成立背景到关键技术授权，再到具体芯片架构的演进，全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]

蜡笔小新   2024-11-14 15:04:34

java
Java 15 发布，带来多项重要更新！

2020年9月15日，Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性，包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]

蜡笔小新   2024-11-14 12:11:09

int
三角测量计算三维坐标的代码_双目三维重建——层次化重建思考

双目三维重建——层次化重建思考FesianXu2020.7.22atANTFINANCIALintern前言本文是笔者阅读[1]第10章内容的笔记，本文从宏观的角度阐 ... [详细]

蜡笔小新   2024-11-13 19:31:37

php
SoundPool

如果应用程序经常播放密集、急促而又短暂的音效（如游戏音效）那么使用MediaPlayer显得有些不太适合了。因为MediaPlayer存在如下缺点：1)延时时间较长，且资源占用率高 ... [详细]

蜡笔小新   2024-11-13 16:47:19

java
com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例

com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例 ... [详细]

蜡笔小新   2024-11-13 10:47:33

function
在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]

Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]

蜡笔小新   2024-11-13 09:49:14

version
实现滑动界面及过渡动画的方法

本文介绍了如何使用 Gesture Detector 和 overridePendingTransition 方法来实现滑动界面和过渡动画。 ... [详细]

蜡笔小新   2024-11-17 07:45:07

java
开发笔记:前端之前端初识

开发笔记:前端之前端初识 ... [详细]

蜡笔小新   2024-11-16 16:05:59

int
LeetCode 实战：寻找三数之和为零的组合

给定一个包含 n 个整数的数组，判断该数组中是否存在三个元素 a、b、c，使得 a + b + c = 0。找出所有满足条件且不重复的三元组。 ... [详细]

蜡笔小新   2024-11-15 18:39:48

java
PHP-Casbin v3.20.0 发布，性能显著提升

PHP-Casbin v3.20.0 已经发布，这是一个使用 PHP 语言开发的轻量级开源访问控制框架，支持多种访问控制模型，包括 ACL、RBAC 和 ABAC。新版本在性能上有了显著的提升。 ... [详细]

蜡笔小新   2024-11-15 10:54:38

int
pytorch(一)：torch构建数据集并训练一个神经网络

目录预备知识导包构建数据集神经网络结构训练测试精度可视化计算模型精度损失可视化输出网络结构信息训练神经网络定义参数载入数据载入神经网络结构、损失及优化训练及测试损失、精度可视化qu ... [详细]

蜡笔小新   2024-11-14 13:06:38

java
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新   2024-11-13 06:03:30

int
单片微机原理P3：80C51外部拓展系统

　　外部拓展其实是个相对来说很好玩的章节，可以真正开始用单片机写程序了，比较重要的是外部存储器拓展，81C55拓展，矩阵键盘，动态显示，DAC和ADC。0.IO接口电路概念与存 ... [详细]

蜡笔小新   2024-11-12 19:51:29

sunsijia

业精于勤荒于嬉

Tags | 热门标签

stream

split

httprequest

require

integer

int

export

iostream

merge

match

join

testing

format

default

uml

byte

grid

function

cSharp

php

heatmap

usb

php5

php8

keyword

java

cookie

fetch

yaml

version

RankList | 热门文章

1win7处理未找到iertutil.dll的解决教程 iertutil.dll丢失win7

2单顶置凸轮轴与双顶置凸轮轴的优缺点

364位win7 Intel 无线网卡蓝屏的问题

4201720182 20165336 实验四《Android开发基础》实验报告

5Linux 学习基础第一部分

6【DWR】学习笔记（一）：基本配置&&前后台的数据传输与处理

7java变成,java编程基础知识

8c/c++开发分享如何查找arrays的项目长度/数量？

9使用Sublime Text 2编辑和运行nodewebkit应用

10android ndk编译x264开源(用于android的ffmpeg中进行软编码)

11C语言Void指针练习1

12ThreadPoolExecutor源码解析(线程池的工作原理)

13RedHat6.3使用CentOS YUM源更新的方法

14二十、事件入门

15idea注册激活码破解方法